实施 数据 去 标识 化 的 指南 -me 穴 


科学 家 、 监 管 部 门 和 律师 是 如 何 
理解 去 识别 化 的 ? 去 识别 化 数据 
与 匿名 数据 或 假名 数据 有 什么 区 
别 ? 数据 可 识别 性 不 是 二 元 对 立 
的 。 它 反而 属于 多 种 层级 。 


这 是 有 关 如 何 区 分 不 同类 别 数据 
的 指南 。 
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可 识别 性 的 层级 名 数据 去 识别 化 数据 匿名 数据 
包含 直接 与 间接 标识 符 的 信息 。 直接 标识 符 消除 化 或 转变 化 的 直接 和 已 知 间接 标识 符 被 消除 直接 和 间接 标识 符 都 通过 数学 
信息 ， 但 间接 标识 符 还 留存 。 化 或 操控 化 ， 故 此 打破 与 现实 和 技术 机 制 移 除 或 修改 ， 以 此 
身份 的 联系 。 防止 被 重新 识别 。 
受 保护 而 被 
明确 个 人 可 识别 化 不 方便 识别 化 密 铀 编 和 潜 : 旭 保护 假名 去 识别 化 去 识别 化 匿名 聚合 匿名 
直接 标识 符 | 
直接 识别 个 人 身份 的 数据 。 和 


无 需 额外 信息 或 与 公共 领 
域 信息 进行 连接 (例如 姓名 、 
社会 保障 号 码 ) 。 


间接 标识 符 

以 间接 的 方式 识别 个 人 身 
份 。 有 助 于 连接 信息 片段 ， 
直到 可 以 挑 出 一 个 人 为 止 
(例如 生日 性别 ) 。 


消除 化 或 转变 化 消除 化 或 转变 化 消除 化 或 转变 化 


保障 和 控制 措施 

技术 、 组织 和 法 律 上 的 控制 
措施 。 防 止 员 工 \ 研 究 人 员 
或 其 他 第 三 方 进行 重 标识 。 


不 相关 - 由 于 不 相关 - 由 于 


不 相关 = 由 于 有 限 或 有 限 或 有 限 或 
数据 的 性 质 高 度数 据 聚 合 


数据 的 性 质 无 控制 机 制 L 有 控制 机 Ed 控制 机 秆 有 控制 机 制 | 无 控制 机 制 | 具有 控制 机 制 


例子 姓名 、 地 址 、 电 话 号 码 ， 设备 标识 符 、 车 牌 、 病 ” 相同 于 可 识别 化 数据 ， 保管 只 能 存 取 临 床 或 。 独特 人 工 假名 替换 直 跟 假名 一 样 除非 保 数据 被 压制 , 广义 化 ，” 跟 去 识别 化 一 样 除非 ” 例如 将 数据 集 用 于 校 ” 极 高 度 聚 合 数据 (例如 
身份 证 历 编 号 .cookie、IP 地 除了 受 保障 和 控制 的 。 研究 集 ( 例 如 王 先生 ， ” 接 标识 符 (例如 王 先生 ” 障 控制 的 机 构 也 保 扰动 , 交换 等 (例如 保障 控制 的 机 构 也 保 ” 准 噪 音 , 故此 隐藏 某 ”统计 数据 、 人 口 普查 数 


显示 


址 (例如 , MAC 地 址 ”数据 (例如 , 散 列 MAC ”糖尿 病 , HgB 15.1 g/dl =5L7TLX6197) (独特 ” 护 数 据 GPA:3.2= 3.0-3.5、 性 ” 护 数 据 个 人 是 否 在 场 (差分 。 据 、 或 人 口 数据 
68:A8:6D:35:65:03) 地址 与 法 律 陈 述 ) = Csrk123) 序列 没有 其 它 用 处 ) 别 : 女性 = 性 别 : 男性 ) 隐私 ) 52.6% 的 华盛顿 州 (DC) 
居民 是 女性 之 类 的 ) 


